# 7.1

alturaaosdoisanos <- c(39,30,32,34,35,36,36,30)
alturaaosdoisanos
alturaadulto <- c (71,63,63,67,68,68,70,64)
alturaadulto
alturas <- data.frame (alturaaosdoisanos,alturaadulto)
class (alturas)
str (alturas)
head (alturas)
alturas.lm <- lm (alturaadulto ~ alturaaosdoisanos, data= alturas)
alturas.lm
summary (alturas.lm)
alturas.conf <- confint(alturas.lm)
alturas.conf

# Grfica

plot (alturaadulto ~ alturaaosdoisanos, data= alturas)
abline (alturas.lm, col= "blue", lwd= 2)
alturas$alturaadultoesperada = (altura$alturaaosdoisanos)*2
modelo <- lm (alturaadultoesperada ~ alturaaosdoisanos, data= alturas)
abline (modelo, col= "red", lwd=2)

# 7.2

library(MASS)
data(Animals)
anim.m2 <- lm(log(brain)~log(body),data=Animals,subset=!(log(Animals$body)>8&log(Animals$brain)<6))
anim.m0 <- lm(log(brain)~1, data=Animals,subset=!(log(Animals$body)>8&log(Animals$brain)<6))
anova(anim.m0,anim.m2)
anova(anim.m2)

# O comando anova (anim.m0,anim.m2)compara os dois modelos, na razo de varincia entre eles. Noentanto no h diferenca entre modelo anim.m0 e o modelo anim.m2

summary(anim.m0)
mean(log(Animals$brain[!(log(Animals$body)>8&log(Animals$brain)<6)]))
sd(log(Animals$brain[!(log(Animals$body)>8&log(Animals$brain)<6)]))

# a mean  igual ao valor estimado do intercepto no modelo anim.m0 e sd  o valor do erro padro do modelo anim.m0

# 7.3

search ()
ls(6)
iris
class (iris)
str (iris)
head (iris)
irissetosa <- subset(iris,iris$Species=="setosa")
irissetosa
lm.iris <- lm ( Sepal.Width ~ Sepal.Length, data= irissetosa)
summary (lm.iris)
lm.iris.coef <- coef (lm.iris)
lm.iris.coef 
a <- lm ( Sepal.Width ~ Petal.Length, data= irissetosa)
resa <- residuals (a)
resa
b <- lm (Sepal.Length ~ Petal.Length, data= irissetosa)
resb <- residuals (b)
resb
lm.iris.nopetal  <- lm (resa ~ resb,  data= irissetosa)
summary (lm.iris.nopetal)
lm.iris.nopetal.coef <- coef (lm.iris.nopetal)
lm.iris.nopetal.coef

# 7.4

search ()
ls (6)
pressure
p <- pressure$pressure
p
t <- pressure$temperature
t
reg1 <- lm (p~ t)
summary (reg1)
reg2 <- lm (p ~ t + I (t^2))
summary (reg2)
reg3 <- lm (p ~ t + I(t^2) + I(t^3))
summary (reg3)
sum.mod3 <- summary (reg3)
r2 <- sum.mod3$r.squared
r2

# 7.5

aves <- read.table ("aves_cerrado.csv",header=T, sep=";")
str (aves)
head (aves)
aves
aves$urubu[is.na (aves$urubu)] <-0
aves$carcara[is.na (aves$carcara)] <-0
aves$seriema[is.na (aves$seriema)] <-0
aves$fisionomia [aves$fisionomia == "ce"] <- "Ce"
aves$fisionomia <- factor (aves$fisionomia, levels=c("CL","CC", "Ce"))
fisioce <- subset (aves,aves$fisionomia == "Ce")
mod.ce <- lm (seriema ~ carcara, data =fisioce)
summary (mod.ce)
fisioCC <- subset (aves,aves$fisionomia == "CC")
mod.cc <- lm (seriema ~ carcara, data =fisioCC)
summary (mod.cc)
fisioCL <- subset (aves,aves$fisionomia == "CL")
mod.cl <- lm (seriema ~ carcara, data =fisioCL)
summary (mod.cl)
sum.ce <- summary (mod.ce)
p.ce <- sum.ce$coefficients [2,4]
sum.cc <- summary (mod.cc)
p.cc <- sum.cc$coefficients [2,4]
sum.cl <- summary (mod.cl)
p.cl <- sum.cl$coefficients [2,4]
coef.ce <- coef (mod.ce)
coef.cc <- coef (mod.cc)
coef.cl <- coef (mod.cl)

# 7.b

setwd ("C:/Users/jess eduardo ortega/Documents/CURSO-R/Aula-6")
arquivo <- read.table("archivo1.1.csv", header=T, sep=";", as.is=F)
arquivo
arquivo$age[arquivo$age==99] <- NA
arquivo$height[arquivo$height==99] <- NA
arquivo$smoke[arquivo$smoke==9] <- NA
arquivo$smoke <- as.logical(arquivo$smoke)
arquivo <- arquivo[apply(is.na(arquivo),1,sum)==0,]
summary(arquivo)
mod.geral <- lm(bwt~gestation + smoke + parity + age + weight + height + gestation:smoke, data=arquivo)
summary(mod.geral)
anova(mod.geral)

mod.noage <- lm(bwt~gestation + smoke + parity + weight + height + gestation:smoke, data=arquivo)
summary(mod.noage)
anova(mod.noage)

mod.noweight <- lm(bwt~gestation + smoke + parity + height + gestation:smoke, data=arquivo)
summary(mod.noweight)
anova(mod.noage)

mod.noparity <- lm(bwt~gestation + smoke + height + gestation:smoke, data=arquivo)
summary(mod.noparity)
anova(mod.noparity)

mod.inter <- lm(bwt~gestation + smoke + height,  data=arquivo)
summary(mod.inter)
anova(mod.inter)

# O melhor modelo que explica a relao entre o peso de recien nacidos  o modelo mod.inter, pois presenta as variavies con maoir valor de significancia.






